iT邦幫忙

2024 iThome 鐵人賽

DAY 5
0
AI/ ML & Data

我的深度學習-從0開始實作物件偵測系列 第 5

【Day 5】YOLO的版本迭代介紹之 3

  • 分享至 

  • xImage
  •  

一、前言

版本迭代的最終篇,接續前2篇對YOLO迭代的基礎介紹,接著要說明的是由v7到v9的演變,那就開始吧!

YOLO v7

主要分成兩個方面去優化:模型架構優化訓練過程優化

  • 借鑒了YOLO v5、Scale YOLO v4、YOLOX,「拓展」和「複合縮放」方法,以便高效的利用參數和計算量。
  • 提出了一種新的標籤分配方法。
    image

v7的測試對比。 YOLO v7 Paper

YOLO v8

利用了與YOLOv5類似的程式碼,但採用了新的結構,其中使用相同的程式碼來支援分類、實例分割和物件偵測等任務類型。模型仍然使用相同的YOLO v5 YAML格式初始化,資料集格式也保持不變。

v8相較於前幾代的優勢:

  • 更友好的安裝/運作方式
  • 速度更快、準確率更高
  • 新的backbone,將YOLO v5中的C3更換為C2F
  • YOLO系列第一次嘗試使用anchor-free

YOLO v9

使用了Programmable Gradient Information, PGI 和一種新的輕量架構 — Generalized Efficient Layer Aggregation Network, GELAN 來處理深度神經網路中的訊息損失問題。

v9的優勢:

  • 性能提升:YOLO v9 在物體檢測的精度和速度方面,具有進步和優勢。
  • 效率優化:在保證高性能的同時,也實現了模型效率的顯著提升。
  • 泛化能力:在多種不同類型的數據集上都能達到優異的性能。
    image

MS COCO 資料集上即時目標偵測器的比較。圖片來源:YOLO v9 Paper

二、結論

在這個YOLO的版本迭代的系列中,雖然內容較於枯燥乏味,筆者也花了大量時間去閱讀不同的文章和論文。通過理解了YOLO演算法的各個版本,對於YOLO的原理以及改動的項目有了更深度的理解。學習這些不僅對YOLO的技術有了更深入的了解,還學習到了很多視覺領域的最新研究和發展。希望這個系列能幫助讀者們更好的理解和應用YOLO技術,並激發大家對物件偵測的技術有更多的興趣。

接著要來說說YOLO是怎麼運作的,感謝各位的觀看,我們下篇見。
image


上一篇
【Day 4】YOLO的版本迭代介紹之 2
下一篇
【Day 6】YOLO的運作方式
系列文
我的深度學習-從0開始實作物件偵測30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言